Protein

Browse of TCMCG078C21968 protein

CDS


Accession Number	TCMCG078C21968
gbkey	CDS
Protein Id	KAG0488822.1
Location	join(40875419..40875601,40875699..40875794,40875904..40876016,40876113..40876179,40876284..40876376,40876470..40876613,40876929..40877017,40877113..40877218,40877289..40877376,40877483..40877601,40877731..40877895,40878608..40878777,40878862..40878971,40879055..40879164,40879274..40879384,40879457..40879558,40879671..40879876,40879978..40880296,40880390..40880500)
Organism	Vanilla planifolia
locus_tag	HPP92_007633

Protein


Length	833aa
Molecule type	protein
Topology	linear
Data_file_division	PLN
dblink	BioProject:PRJNA633886, BioSample:SAMN14973820
db_source	JADCNL010000003.1
Definition	hypothetical protein HPP92_007633 [Vanilla planifolia]
Locus_tag	HPP92_007633

EGGNOG-MAPPER Annotation


COG_category	G
Description	beta-galactosidase
KEGG_TC	-
KEGG_Module	-
KEGG_Reaction	-
KEGG_rclass	-
BRITE	-
KEGG_ko	-
EC	-
KEGG_Pathway	-
GOs	GO:0003674 [VIEW IN EMBL-EBI] GO:0003824 [VIEW IN EMBL-EBI] GO:0004553 [VIEW IN EMBL-EBI] GO:0004565 [VIEW IN EMBL-EBI] GO:0005575 [VIEW IN EMBL-EBI] GO:0005618 [VIEW IN EMBL-EBI] GO:0005622 [VIEW IN EMBL-EBI] GO:0005623 [VIEW IN EMBL-EBI] GO:0005737 [VIEW IN EMBL-EBI] GO:0005773 [VIEW IN EMBL-EBI] GO:0015925 [VIEW IN EMBL-EBI] GO:0016787 [VIEW IN EMBL-EBI] GO:0016798 [VIEW IN EMBL-EBI] GO:0030312 [VIEW IN EMBL-EBI] GO:0043226 [VIEW IN EMBL-EBI] GO:0043227 [VIEW IN EMBL-EBI] GO:0043229 [VIEW IN EMBL-EBI] GO:0043231 [VIEW IN EMBL-EBI] GO:0044424 [VIEW IN EMBL-EBI] GO:0044444 [VIEW IN EMBL-EBI] GO:0044464 [VIEW IN EMBL-EBI] GO:0071944 [VIEW IN EMBL-EBI]

Sequence

CDS:
ATGGGCACTCATTGGTGGTCGCCGGGGAGAGCGGTAGGACCGCCACTGCTGGCCGTGGTGATTTTGTCTCTTTTAACTCCGGCGGCCGCCTCCGTTGCCTACGATCACAAGGCCATCATCATTAATGGGCAGCGGAGGATACTCCTCTCCGGTTCGATTCATTACCCGAGAAGCACTCCACAGATGTGGCCGGATCTTATCCAGAAGGCTAAAGATGGCGGTTTGGACGTCATACAGACCTATGTTTTCTGGAATGGGCACGAGCCATCACCCGGTCAGTATTATTTCGAAGAAAGATTTGATCTTGTTCAATTCATCAATCTAGTGAAGAAGGCCGGTCTCTACGTTAACCTCCGCATTGGCCCCTATATTTGTGCTGAATGGAATTTTGGGGGATTCCCAGTTTGGTTAAAATATGTTCCAGGGATTCAGTTCCGAACTGCAAACGAGCCTTTCAAGGCTGCCATGAAAAATTTCACGGCAAAGATTGTCTCCATGATGAAGTCTGAAGGGCTGTTTCATTGGCAGGGTGGCCCCATCATTCTCTGTCAGATTGAGAATGAGTTTGGGCCATTGGAGTGGGATCAAGGAGCTCCAGTGAAGGCCTATGCGGCATGGGCAGCCGAGATGGCTGTTGGCCTTGATACTGGTGTCCCATGGATCATGTGCAAAGAAGATGATGCTCCTGATCCAGTTATCAACACCTGGAATGGTTTCTATGGTGATTACTTCTCCACAAACCGACCTTACAAGCCTGCCATGTTGACTGAGGTCTGGACTGGCTGGTTCACTGGATTTGGAGCTCCAGTGCCACACAGGCCTGTTGAAGATTTGGCTTTTGCTGTCGCAAAGTTTATACAGAAGGGAGGATCTTTTGTTAACTATTACATGTACCATGGAGGAACAAACTTCGGCCGCACAGCTGGGGGTCCTTTCATTGCAACTAGCTACGATTATGATGCTCCTATTGATGAATTTGGACTTGTGAGAGAACCAAAATGGGGTCATTTGAGAGACCTACATAGAGCAATCAAATTGTGTGAAATGGCTTTGGTTTCTGGGGATCCTGTAGTAACATCACTTGGAAATACTCAAGAGTCATATGTCTACGGGTCAAATTCTGGGTATTGTGCTGCATTTCTTGCGAACTATGATACAAAATATTATGCCAGGGTTATTTTCAATGGAATGCATTATGACCTTCCTCCTTGGTCAATTACCATCCTTCCGGACTGCAAAACTACAGTTTTCAATACTGCAAAGGTAGGAGTCCAGACCTCACTAATGCAAATGAATCCAGTGGTAGGCTTCACTTGGCAATCATACGGTGACGAAACAAAATTTGATGATGACAACTCATTCACAGCTATTGGATTGTTGGAGCAAATAAACATGACCAGAGATACCAGTGACTACCTGTGGTATAAGACAAATGTTGACATTGCTCAAGATGAAAGCTTTTTGAAAGGTGGAGCTTATCCAGTTCTTACTGTAATGTCTGCTGGTCACTCTTTGAGTGTTTTTGTCAATGGCCAATTAGCAGGCTCTGCATATGGTGGCTTGCAGGACCCAAGGCTCACATATTCTGAATGCATTGAGTTGCAATCTGGAAGCAACACAATCTCCATCTTAAGCGCATCGGTTGGTCTTCCTAACGTAGGGGAGCATTTTGAGACCTGGAACACTGGAGTACTTGGTCCAGTCACATTAAGTGGTCTCAATGAGGGGAAAAGAGACCTGACCTGGCAGAACTGGAGCTATAAGATTGGTTTGAAAGGTGAAGCCCTGAACCTTCACACAACTAGTGGTATCTCATCAGTTGAATGGCAAGAGTCGTATCCAAAACAACCGCTAACTTGGTACAAGGCTTTCTTTGATGCACCGGAGGGAAGTGATCCCTTGGCAATTGATATGGGTAGCATGGGCAAGGGACAAATATGGATAAATGGACAAAGCATAGGAAGATATTGGCCTGGTTATACTGCAACCGGTGATTGTGGCGCATGTGATTATCATGGAGAATTCAACGAGGCAAAGTGTCGAACTAACTGTGGGGAGCCCTCTCAAAGATGGTATCATGTCCCTCGCTCCTGGCTAAACCCGACGGGGAATTTGTTGGTCTTGTTTGAAGAATGGGGTGGAGATCCAAGTGGCATTTCCATGGTCGCAAGGAAGGTAGGGAGCATATGTGCTTATGTTTCTGAGTGGCAGCCTTCAATCATTAACTGGCGGATGAAGGACTACAAGAAGGCAAAGGTCCATCTATCTTGCCCCGAAGGAAAAAAGATCACCACGATAAAATTTGCTAGCTTTGGTACTCCACAAGGTGTCTGTGGAAACTTCTCGGAAGGAAGTTGTCATGCCCGTAAATCGTTCGACGTTTTTGAGAAGAGATGCATTGGTCTTGCCTCGTGTTCAGTCGCAGTTGTGGCTGAAGTTTTTGGAGGAGACCCTTGCCCAGGAGTGATGAAGGCTTCTGCGGTAGAGGCAATCTGTGAATAG

Protein:
MGTHWWSPGRAVGPPLLAVVILSLLTPAAASVAYDHKAIIINGQRRILLSGSIHYPRSTPQMWPDLIQKAKDGGLDVIQTYVFWNGHEPSPGQYYFEERFDLVQFINLVKKAGLYVNLRIGPYICAEWNFGGFPVWLKYVPGIQFRTANEPFKAAMKNFTAKIVSMMKSEGLFHWQGGPIILCQIENEFGPLEWDQGAPVKAYAAWAAEMAVGLDTGVPWIMCKEDDAPDPVINTWNGFYGDYFSTNRPYKPAMLTEVWTGWFTGFGAPVPHRPVEDLAFAVAKFIQKGGSFVNYYMYHGGTNFGRTAGGPFIATSYDYDAPIDEFGLVREPKWGHLRDLHRAIKLCEMALVSGDPVVTSLGNTQESYVYGSNSGYCAAFLANYDTKYYARVIFNGMHYDLPPWSITILPDCKTTVFNTAKVGVQTSLMQMNPVVGFTWQSYGDETKFDDDNSFTAIGLLEQINMTRDTSDYLWYKTNVDIAQDESFLKGGAYPVLTVMSAGHSLSVFVNGQLAGSAYGGLQDPRLTYSECIELQSGSNTISILSASVGLPNVGEHFETWNTGVLGPVTLSGLNEGKRDLTWQNWSYKIGLKGEALNLHTTSGISSVEWQESYPKQPLTWYKAFFDAPEGSDPLAIDMGSMGKGQIWINGQSIGRYWPGYTATGDCGACDYHGEFNEAKCRTNCGEPSQRWYHVPRSWLNPTGNLLVLFEEWGGDPSGISMVARKVGSICAYVSEWQPSIINWRMKDYKKAKVHLSCPEGKKITTIKFASFGTPQGVCGNFSEGSCHARKSFDVFEKRCIGLASCSVAVVAEVFGGDPCPGVMKASAVEAICE

Browse of TCMCG078C21968 protein

CDS

Protein

EGGNOG-MAPPER Annotation

Sequence